得益于语音情绪识别(SER),计算机可以以情感智能的方式理解并与人互动。但是,可以显着改善SER在交叉和现实世界中的实时数据供稿方案中的性能。无法将现有模型调整到新域是SER方法的缺点之一。为了应对这一挑战,研究人员开发了域的适应技术,这些技术转移了模型在整个领域中学习的知识。尽管现有的域适应技术已经改善了跨域的性能,但可以改进它们以适应现实世界中的实时数据提要情况,在这种情况下,模型可以在部署时可以自动调整。在本文中,我们提出了一种基于强化的学习策略(RL-DA),用于在与环境互动并收集持续反馈的同时,将预训练的模型调整为现实世界中的实时数据供稿设置。 RL-DA对SER任务进行了评估,包括跨语言和跨语言域自适应模式。评估结果表明,在实时数据供稿设置中,RL-DA在跨科普斯和跨语言场景中的基线策略分别优于基线策略。
translated by 谷歌翻译